KNN是一種用來分類的模型,他的概念可以說是『誰的人多誰就是老大』。使用KNN演算法大致可以分成3個步驟:
Step1:決定k值
Step2:得出所有資料點之間的距離
Step3:得出離自己最近的k個點
Step4:看看這k個點中哪一個類別的最多,自己就是哪一個類別
拿上方的例子來看,。若是我們的k設定為3,則以虛線圓圈內的中心正方形就會去找離他最近的三個資料,得出是2個圓形、1個三角形,則由於多數決的緣故,這個正方形的新分類就會被設定為圓形。
而這個結果會隨著我們設定的k值大小,導致結果跟著改變。就像下方,我們使用同一張圖以及同一個基準點,但現在的k值從原本的3改變成5。我們的鄰居就會從2個圓形、1個三角形變成3個三角形、2個圓形。因此新分類也從圓形變成了三角形。
所以我們可以得出結論,在KNN之中,k值的設定對於整體模型來說非常重要,只要改變了k值,我們的最終結果可能就會有很大的差異。